3.2 Neyman-Pearson理论

1 问题提法 原假设与对立假设

假设检验问题

有样本XX. 只知道X的分布属于分布族{Fθ|θΘ}. ΘHΘ的一个非空真子集, 则H:θΘH(存在θ0ΘH, 使X的分布为Fθ0)称为一个**(原/零)假设**. 记ΘK=ΘΘH, 则K:θΘK称为H对立/备选假设.
表述(1.1)H:θΘHK:θΘK称为一个假设检验问题. 我们需要根据样本X的取值选择接受或否定H(也即接受H,K中的一个).

与前面的提法不同的是, 这里明确提出了对立假设, 可以对同一假设不同检验的优劣进行比较.

2 否定域 检验函数

否定域 检验函数 随机检验

(1.1) 的假设检验事实上就是寻找一个法则, 根据样本决定接受或者否定H. 因此可以把X分解为互不相交的X1,X2, 样本属于X1时接受H, 属于X2时否定H. 因此X2称为检验的否定域; X1称为接受域.
进一步推广为: 检验是函数φ:X[0,1]. φ表示有了样本x后否定H的概率, 称为检验函数. 如果φ(x)=1, 否定H; φ(x)=0, 接受H; 0<φ(x)<1, 安排随机试验, 使其中某个事件A的概率为φ(x), 看A是否发生.

  • 如果φ取值只有0,1, 称为非随机检验, 否定域就是{x|φ(x)=1}.
  • 否则存在φ(x)(0,1), 称为随机检验, 在实际中不常用.

3 两类错误与功效函数

我们希望检验方法犯错误的概率尽可能的小.

功效函数

φ是检验 (1.1) 的一个检验函数, 称(3.1)βφ(θ)=Pθ(φ否定H)=Eθ(φ(X)),θΘ称为φ功效函数.
如果φ为非随机检验, 否定域为X2, 则βφ(θ)=Pθ(XX2).

知道功效函数后, 可以计算出φ犯第一类错误的概率={βφ(θ),θΘH,0,θΘK,(3.2)φ犯第二类错误的概率={0,θΘH,1βφ(θ),θΘK.

4 检验水平 真实水平 限定第一类错误概率的原则

水平α检验

φ犯第一类错误的概率如果总不超过α(θΘ), 则称α是检验φ的一个水平, φ称为水平α检验.

(3.2), 得 α 是水平 α 检验的充要条件是 βφ(θ)α,θΘH. 检验的水平自然不唯一, 把一个检验的最小水平 (取 βφ(θ) 的上确界 sup{βφ(θ)|θΘH}) 称为真实水平.

我们当然希望一个检验犯两类错误的概率都很小, 但是这不可能同时兼得. 因此我们通常限定第一类错误的概率上界为 α (设置门槛如 0.05,0.01,0.005 等, 而又以 0.05 最多), 然后尽可能减小第二类错误的发生概率.